# -*- coding = utf-8 -*-
# @Time : 2021/7/15 9:52
# @Author : 龙王赘婿_彪少
# @File : testBs42.py
# @Software: PyCharm


from bs4 import BeautifulSoup
import re

file = open("./baidu.html", "rb")
myhtml = file.read().decode("utf-8")

#解析器 变成树结构
bs = BeautifulSoup(myhtml, "html.parser")

#文档搜索

#查找所有
#字符串过滤
# t_list = bs.find_all("a")

#正则表达式搜索 只要你的标签含有a的，就把你的标签及其字内容全部导出
# t_list = bs.find_all(re.compile("a"))

#方法搜索 函数要求搜索
def name_is_exists(tag):
    return tag.has_attr("name")

t_list = bs.find_all(name_is_exists)

# print(t_list) #列表保存

for item in t_list:
    print(item)